摘要。单细胞RNA测序(SCRNA-SEQ)彻底改变了我们在细胞水平上分析基因表达的能力。通过提供每个单个细胞基因表达的数据,SCRNA-SEQ具有数千个基因的大型数据集。但是,处理此类高维数据会由于复杂性的增加而带来计算挑战。维度降低对于SCRNA-SEQ分析至关重要。各种维度还原算法,包括原理成分分析(PCA),统一的歧管近似和投影(UMAP)和T-分配的随机邻居嵌入(T-SNE),通常用于应对这一挑战。这些方法将原始的高维数据转换为较低维的表示,同时保留相关信息。在本文中,我们提出了壮举。我们将其分为多个子空间,而不是将维度降低直接降低到整个数据集。在每个子空间中,我们应用缩小尺寸技术,然后合并减少的数据。featpca提供了四个用于基础的变体。我们的实验结果表明,基于基本的聚类比使用完整数据集的精度更好。在各种SCRNA-SEQ数据集中,featpca始终优于现有状态聚类工具。
主要关键词
![arxiv:2502.05647v1 [CS.CC] 2025年2月8日PDF文件第1页](/bimg/8/84570a1ddd9ad4af97fe0419a7d950046b77864c.webp)
![arxiv:2502.05647v1 [CS.CC] 2025年2月8日PDF文件第2页](/bimg/0/0a67beaea54651c6a5a84dc4247049e82a89a2e5.webp)
![arxiv:2502.05647v1 [CS.CC] 2025年2月8日PDF文件第3页](/bimg/a/a98a5168e9fa9ac17ce69071e12b1bb2fd4ef9cc.webp)
![arxiv:2502.05647v1 [CS.CC] 2025年2月8日PDF文件第4页](/bimg/1/165ce182741307343febd6ea22ecda52d34fffcb.webp)
![arxiv:2502.05647v1 [CS.CC] 2025年2月8日PDF文件第5页](/bimg/2/228e07a61760df07636de99fc7da67398f2f1518.webp)
